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。 研 究 方法 (Research Method) ° 


共同 方法 变异 是 “致命 瘟疫 ”了 吗 ? 
一 一 论争 、 新 知 与 应 对 ” 
kE Bla! 


(国防 大 学 政治 学 院 EI 200433) @ 陆军 炮兵 防空 兵 学 院 军 政 基 础 系 , 合肥 230031) 


摘 要 共同 方法 变异 是 由 构 念 间 相 似 的 测量 方法 特征 引起 的 系统 变异 ， 可 焉 曲 构 念 间 的 关系 ,造成 共同 方 
法 偏差 。60 ER, 这 一 问题 在 社会 科学 研究 中 被 反复 提 及 ,但 它 是 否 严 重 威胁 研究 效 度 尚 无 定论 。 虽然 实证 
证 据 表 明 ， 共 同方 法 变异 普遍 存在 ， 数 据 来 源 、 测 量 时 间 、 问 卷 设 计 等 因素 可 导致 共同 方法 偏差 ， 使 自我 报告 
的 横断 式 调查 研究 饱 受 质疑 但 部 分 学 者 从 测量 误差 和 非 共 同方 法 变异 的 制约 作用 等 角度 做 出 了 回应 和 辩护 ， 
认为 无 需 过 度 担 忧 。 以 测量 为 中 心 的 新 视角 强调 共同 方法 变异 是 测量 方法 和 被 测 构 念 交互 作用 的 产物 ， 应 从 
方法 和 构 念 两 个 维度 评估 共同 方法 变异 风险 .建议 研究 者 树立 均衡 无 偏 的 态度 ， 接 纳 共 同方 法 变异 的 存在 ， 纠 
正 对 自我 报告 的 偏见 ， 着 重 通过 改进 研究 设计 做 好 预先 应 对 。 

关键 词 ”共同 方法 变异 ; 共同 方法 偏差 自我 报告 ; 研究 设计 ; ME 

分 类 号 B841 


1 引言 真实 相关 系数 的 程度 ， 多 数 情况 下 表现 为 观测 相 
关系 数 的 膨胀 或 高 估 ， 有 时 可 能 引起 假 阳性 结果 ， 
导致 错误 的 因果 关系 推论 (Doty & Glick, 1998; 
Fuller, Simmering, Atinc, Atinc, & Babin, 2016; 
Min, Park, & Kim, 2016)。 学 界 对 共同 方法 变异 的 
担忧 源 于 它 为 构 念 间 的 相关 性 提供 了 研究 假设 之 
外 的 替代 解释 ， 构 念 间 的 关系 若 大 部 分 归于 共同 
方法 的 虚假 效应 和 人 为 假象 (artifact), 无 疑 会 为 
逻辑 网 络 (nomological network) 的 完善 和 理论 的 
建构 带 来 灾难 性 后 果 (Reio, 2010)。 

在 心理 学 、 组 织 管理 等 行为 科学 领域 ， 共同 
方法 变异 是 一 个 敏感 而 微妙 的 话题 。 其 敏感 之 处 
在 于 ， 它 严重 威胁 研究 结论 的 可 靠 性 ， 更 与 论文 
能 否 发 表 息息相关 ; 其 微妙 之 处 在 于 ,学 界 对 于 
它 究 竞 是 “致命 瘟疫 ”还 是 “都 市 传说 ”的 热烈 讨论 
已 持续 了 60 年, 但 至 今 仍 未 达成 共识 (Doty & Glick, 
1998; Podsakoff et al., 2012; Richardson, Simmering, 
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共同 方法 变异 (common method variance) 是 社 
会 科学 实证 研究 中 被 反复 提 及 的 重要 方法 学 问 
题 。 任 何 变量 都 会 带 有 一 些 由 特定 测量 方法 引起 
的 系统 变异 即 方法 变异 ， 如 果 两 个 变量 用 同一 方 
法 测量 或 测量 方法 有 某 些 共同 之 处 (例如 数据 来 
自 同一 受 测 者 )， 就 会 共享 一 部 分 方法 变异 ,形成 
共同 方法 变异 (Podsakoff MacKenzie, Lee, & 
Podsakoff, 2003; Spector & Brannick, 2010; 能 红 
E, SKE, 郑 雪 , 2013)， 进 而 造成 构 念 的 信和 度 、 效 
度 估计 偏差 和 构 念 间 观测 相关 系数 的 估计 偏差 
(MacKenzie & Podsakoff, 2012; Podsakoff, MacKenzie, 
& Podsakoff, 2012; 熊 红星， 张 环 ， 叶 宝 娟 ， 郑 雪 ， 
孙 配 贞 ，2012)。 共 同方 法 偏差 (common method 
bias) 是 由 此 衍生 出 的 概念 ， 指 观测 相关 系数 偏离 
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02-ZZLX-40) 资 助 。 1 英文 为 urban legend, 指 人 们 耳熟能详 并 信以为真 的 言论 ， 
通信 作者 : 朱 海 腾 , E-mail: prettypig1990@sina.com 但 真实 性 不 能 保证 。 
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势 :“ 批 判 派 " 坚 称 ， 共 同方 法 变异 带 来 了 巨大 的 效 
度 风险 ,使 很 多 研究 结果 疑点 重重 ; “辩护 派 " 则 
EIK, 这 些 责难 实 属 硅 大 其 词 。 虽 然 纷争 不 止 , 但 
大 多 数 期 刊 和 审 稿 人 都 将 共同 方法 变异 列 为 影响 
论文 质量 的 重要 因素 , 管理 学 期 刊 的 态度 尤其 严 
厉 ， 有 明显 共同 方法 变异 顾虑 的 稿件 常 被 拒 审 。 
有 学 者 统计 ， 早 在 1998 至 2003 年 间 , 4 份 国外 权 
威 管理 学 期 刊 发 表 的 871 篇 实证 论文 中 仅 有 36 篇 
(4.13%) 使 用 了 单一 来 源 数据 ( 彭 台 光 ， 高 月 慈 ， 林 
SEAS, 2006); 甚至 很 多 国外 期 刊 编 委 的 稿件 也 曾 
因 共 同方 法 变异 问题 被 拒绝 (Pace, 2010)。 

在 国内 ， 自 周 浩 和 龙 立 荣 (2004) 介 绍 了 共同 
方法 偏差 的 统计 检验 和 控制 方法 后 ， 学 界 开始 接 
触 和 关注 这 一 问题 。 随 着 多 变量 统计 技术 的 成 熟 
和 共同 方法 变异 在 论文 评审 中 权重 的 增加 ， 研 究 
者 纷纷 采用 程序 和 统计 手段 加 以 应 对 。 当 前 ， 共 
同方 法 偏差 检测 被 认为 是 问卷 数据 建 模 的 奠基 工 
程 之 一 ( 温 忠 腾 ， 黄 彬 彬 ， 汤 丹 丹 , 2018), 《心理 学 
报 》 在 2018 年 3 月 更 新 的 论文 自 检 报 告 中 也 强调 
管理 、 临 床 、 人 格 、 社 会 等 领域 的 问卷 类 研究 须 
详细 论述 共同 方法 偏差 的 检测 和 控制 手段 ， 这 部 
分 日 益 成 为 规范 化 内 容 。 然 而 , 在 负面 态度 占据 
上 风 的 严峻 形势 下 ， 如 临 大 敌 的 研究 者 不 得 不 竭 
力 迎 合 期 刊 的 高 标准 严 要 求 , 试图 以 各 种 “实用 ” 
的 手段 打消 审 稿 人 对 自己 论文 的 怀疑 ， 对 基本 理 
论 却 缺 乏 深究 ， 助 长 了 概念 原理 上 的 认识 误区 、 
应 对 实践 中 的 方法 误 用 和 学 术 评 价 中 的 价值 误 判 ; 
同时 ， 对 共同 方法 变异 威胁 的 先 定 假设 有 意 无 意 

地 影响 着 研究 者 和 审 稿 人 对 共同 方法 变异 的 处 理 
et al., 2009)， 如 果 不 能 从 正 反 
两 面 认 识 这 一 问题 的 人 全貌， 只 是 浅 尝 辑 止 或 仪式 
化 地 做 一 个 Harman 单 因 子 检 验 ， 科 研 实践 就 可 
能 偏离 正轨 。 由 此 观 之 , 有 必要 重新 审视 这 一 “ 讨 
大 因素 ”及 时 检查 和 纠正 偏差 。 本 文 拟 从 实证 证 
据 切入 ,厘清 共同 方法 变异 和 共同 方法 偏差 的 关 
FR, 梳理 对 共同 方法 变异 威胁 的 回应 和 辩护 ,在 
新 视角 下 提出 一 种 共同 方法 变异 的 风险 评估 方法 ， 
最 后 提出 理念 和 实务 上 的 建议 , 期 望 帮助 研究 者 
浴 清 模糊 观念 、 树 立 无 偏 态 度 、 改 良 处 置 策 略 。 


2 HAWA: 共同 方法 变异 与 共同 方法 
偏差 之 检测 与 辨析 


共同 方法 变异 和 共同 方法 偏差 相伴 而 生 ， 是 


一 个 问题 的 两 个 方面 ,它们 密 不 可 分 又 若即若离 ， 
不 少 学 者 视 之 为 可 互 换 的 概念 , 但 它们 有 着 清晰 
的 界限 ， 从 不 同 角度 反映 了 构 念 测量 中 的 “ 副 产 
品 ” 一 一 方法 效应 。 那 么 , 它们 是 否 稳定 而 广泛 地 
存在 于 研究 中 ? 很 多 学 者 进行 了 实证 检测 。 以 下 
首先 简要 回顾 这 些 结果 ,从 中 获得 的 启示 将 帮助 
我 们 把 握 二 者 的 深层 关系 。 

从 历史 发 展 脉络 看 ,学界 对 共同 方法 变异 的 
兴趣 自 多 特质 -多 方法 (multitrait-multimethod,， 
MTMM) 和 矩阵 问世 以 来 就 没有 停止 过 。 在 MTMM 
模型 和 经 典 测 量 理论 框架 下 ， 构 念 的 总 变异 被 分 
解 为 真 分 数 变 异 、 方 法 变异 和 随机 误差 变异 (Lindell 
& Whitney, 2001; Williams & Brown, 1994); 假定 
方法 变异 等 同 于 共同 方法 变异 ,通过 相关 特质 - 
相关 方法 (correlated trait-correlated method, CTCM) 
模型 估计 方法 变异 占 总 变异 的 比例 ， 就 成 为 共同 
方法 变异 的 最 优 检 测 方式 ( 叶 日 武 ， 林 荣 春 ， 
2014)。Podsakoff 等 (2012) 总 结 了 1987~2010 年 间 
的 5 项 研究 ， 发 现 方法 变异 在 总 变异 中 的 比例 为 
18%~32%， 特 质变 异 的 比例 则 在 40%~48% 之 间 ， 
也 就 是 说 , 方法 变异 在 全 部 系统 变异 中 的 比例 达 
到 30% 以 上 , 证 明 Doty 和 Glick (1998) 的 忧虑 
共同 方法 变异 已 成 为 研究 中 无 法 回避 的 问题 
不 无 道理 。 不 过 , 模型 无 法 识别 和 不 适当 解 的 缺 
陷 限 制 了 MTMM 分 析 结果 的 稳健 性 (Malhotra， 
Schaller, & Patil, 2017; Meade, Watson, & Kroustalis, 
2007)， 且 新 近 研 究 发 现 方法 变异 仅 占 总 变异 的 
6.59% 到 16% (Malhotra, Kim, & Patil, 2006; 
Schaller, Patil, & Malhotra, 2015; WEHE, RIRI, 
2012), 与 2000 年 以 前 的 研究 相 比 明显 减少 , SA 
稍 感 宽慰。 

由 于 人 们 更 关心 共同 方法 变异 可 观察 到 的 影 
响 ， 作 为 其 外 部 表征 的 共同 方法 偏差 应 运 而 生 。 
与 真实 相关 系数 相 比 ， 这 种 “偏差 "可 以 是 膨胀 
(inflation) 或 紧缩 (deflation), 但 学 者 对 可 能 导致 假 
阳性 结果 和 工 型 错误 的 膨胀 效应 更 加 敏感 (Fuller 
et al., 2016)。 估 计 共 同方 法 偏差 需求 得 观测 相关 
与 真实 相关 的 差 值 , 但 由 于 真实 相关 不 可 知 , 通常 
的 做 法 是 退 而 求 其 次 , 通过 类 实验 设计 比较 同一 
对 构 念 在 使 用 相同 和 不 同方 法 测量 时 的 相关 性 有 
何 差 异 , 构 念 在 方法 特征 上 的 相似 程度 决定 着 共 
同方 法 偏差 的 大 小 。 关键 方 法 特征 及 检测 结果 如 下 。 

(1) 数 据 来 源 。 构 念 的 测量 可 来 自 单一 受 测 者 
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过 


多 种 渠道 (如 多 个 评定 者 、 客 观 记录 )。 一 个 明显 
的 事实 是 ， 对 共同 方法 变异 的 批评 绝 大 部 分 指向 
研究 者 最 常 使 用 的 自我 报告 单一 来 源 式 横断 调查 
人 研究 (Brannick, Chan, Conway, Lance, & Spector, 
2010; Chang, van Witteloostuijn, & Eden, 2010; Lai, 
Li, & Leung, 2013; Spector & Brannick, 2010). 不 
少 学 者 相信 ， 自 我 报告 数据 带 有 大 量 同 源 偏差 
(common source bias), 得 到 的 结果 不 可 人 和信， 有 些 
审 稿 人 甚至 会 不 假 思 索 地 拒绝 这 类 稿件 (Brannick 
et al., 2010; Spector, 2006)。 现 有 证 据 也 表明 , 单 
一 受 测 者 得 到 的 相关 系数 的 确 偏 高 。 同 源 偏差 程 
度 是 构 念 间 相 关 性 的 调节 变量 ( 陈 春 花 ， 苏 涛 , E 
AH, 2016), Podsakoff 等 的 2 项 元 分 析 发 现 , 较 之 
采用 不 同 评定 者 , 单一 受 测 者 使 相关 系数 发 生 了 
59.5%~304% 的 膨胀 (Podsakoff, Whiting, Welsh, & 
Mai, 2013; Podsakoff et al., 2012), 个 人 或 组 织 绩效 
与 解释 变量 的 关系 也 呈现 出 相似 的 趋势 (Andersen， 
Heinesen, & Pedersen, 2016; Meier & O’ Toole, 2013; 
苏 中 兴 ，, 段 佳 利 , 2015)。 同 源 偏差 在 主观 性 较 强 的 
感知 类 变量 (如 组 织 承 诺 .工作 满意 度 ) 中 更 加 严重 
(Favero & Bullock, 2015; Sharma, Yetton, & Crawford, 
2009; Tehseen, Ramayah, & Sajilan, 2017). 

(2) 测 量 时 间 。 在 同一 时 间 测 量 的 构 念 会 带 1 
系统 性 共 变 ， 因 为 留存 在 短 时 记忆 中 的 信息 增 大 
了 一 致 性 回答 的 概率 ， 导 致 相关 性 的 膨胀 
(Podsakoff et al., 2003)。 研 究 表明 ,在 不 同时 间 点 
(间隔 1 天 到 2 个 月 ) 测 得 的 构 念 间 的 相关 系数 明显 
小 于 一 次 完成 全 部 测量 时 的 结果 (Barraclough，af 
Wahlberg, Freeman, Davey, & Watson, 2014; Johnson, 


Rosen, & Djurdjevic, 2011; Wingate, Sng, & Loprinzi, 
2018). 

(3) 问 卷 设计 。 主 要 涉及 量 表 的 格式 (如 Likert 
量 表 和 语义 区 分 量 表 ) 和 选项 (anchor) 、 题 项 的 语 
义 清 晰 度 。 采 用 选项 内 容 (如 同意 式 或 频率 式 ) 和 数 
量 (如 五 级 计 分 ) 均 相同 的 Likert 量 表 测 量 多 个 构 
Z, 得 到 的 相关 系数 会 偏 高 (Podsakoff et al., 2013; 
Schwarz, Rizzuto, Carraher-Wolverton, Roldan, & 
Barrera-Barrera, 2017); R. RENFE., RRA 
可 的 题 项 会 造成 构 念 的 指标 负荷 、 合 成 信和 度 和 路 
径 系 数 的 膨胀 (Schwarz et al., 2017; Schwarz, 
Schwarz, & Rizzuto, 2008)。 

上 述 诸多 实证 证 据 有 助 于 我 们 理解 共同 方法 
变异 和 共同 方法 偏差 的 联系 和 区 别 。 从 检测 方法 


来 看 ,二 者 遵循 了 不 同 的 技术 路 线 : 由 变异 分 解 
反 推 共同 方法 变异 ， 由 相关 系数 偏 倚 反 推 共 同方 
法 偏差 。 得 到 的 结果 不 尽 一 致 ， 由 于 早期 研究 中 
高 的 方法 变异 比例 没有 在 新 近 研 究 中 复 现 ， 只 
说 共同 方法 变异 确实 存在 , 但 不 见得 是 波及 范 
站 极 广 的 “致命 冶 疫 ”; 不 过 多 数 研究 发 现 相 似 的 
法 特征 会 造成 观测 相关 的 虚 高 ， 可 见 对 共同 方 
法 偏差 的 担忧 并 非 空 六 来 风 。 

从 这 两 点 看 似 矛 盾 的 结论 出 发 , 我 们 认为 可 
对 共同 方法 变异 和 共同 方法 偏差 的 关系 做 如 下 归 


Pi 
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结 :第 一 ,共同 方法 变异 是 因 ， 共 同方 法 偏差 是 果 ， 


共同 方法 变异 是 共同 方法 偏差 存在 的 必要 条 件 。 
相同 或 相似 的 测量 方法 扩大 了 两 个 构 念 共享 的 系 
统 变 异 ， 导 致 相关 系数 的 高 估 。 第 二 ， 二 者 的 因果 
关系 不 是 必然 关系 而 是 或 然 关 系 ， 只 能 说 当 存在 
共同 方法 变异 时 ， 出 现 共 同方 法 偏差 的 概率 增 大 ， 
但 不 具有 确定 性 。 例 如 在 Doty 和 Glick (1998) 的 
研究 中 ， 虽 然 有 83% 的 观测 相关 系数 发 生 膨 胀 
但 一 半 以 上 都 落 在 经 方法 因子 校正 后 的 95% 和 置信 
区 间 中 。 他 们 由 此 认为 ,共同 方法 变异 在 组 织 
究 中 普遍 存在 , 但 共同 方法 偏差 没有 预想 的 那么 
FE, 应 重点 关注 共同 方法 偏差 的 大 小 而 不 是 共 
同方 法 变异 是 否 存在 ; 如 果 共 同方 法 变异 不 影响 
构 念 间 实 质 关 系 的 统计 推断 ， 就 无 需 过 度 担心 。 
EIA, Fuller 等 (2016) 的 模拟 研究 也 发 现 , 在 
常规 信 度 水 平 下 ， 只 有 共同 方法 变异 占据 相当 大 
比例 (总 变异 的 60% 以 上 ) 时 ， 共 同方 法 偏差 才 会 
出 现 , 否则 观测 相关 系数 与 预 设 值 差 异 不 大 。 这 
就 意味 着 共同 方法 变异 不 是 共同 方法 偏差 的 充分 
条 件 。 第 三 ， 以 共同 方法 偏差 反 推 共同 方法 变异 
底 几 可 行 , 但 以 共同 方法 变异 预测 共同 方法 偏差 
不 一 定 稳妥 ， 即 使 检测 出 了 较 大 的 共同 方法 变异 ， 
观测 相关 系数 也 不 一 定 “同步 发生 偏 倚 ; 换言之 ， 
尚未 发 现 二 者 有 稳定 的 强 对 应 关系 。 一 种 可 能 是 ， 
有 的 构 念 对 共同 方法 变异 有 较 强 的 容忍 度 ， 有 的 
则 易 受 影响 这 两 类 构 念 分 别 需 要 不 同 量 的 共同 
方法 变异 来 “触发 "共同 方法 偏差 ( 详 见 第 4 节 )。 
3 ”辩护 陈 词 : 对 共同 方法 变异 “ 脱 敏 ” 
由 于 大 量 研究 一 致 检测 出 了 显著 的 共同 方法 
有 差 ， 越 来 越 多 的 研究 者 相信 它 是 严重 危害 研究 
效 度 的 “大 麻烦 ”自我 报告 研究 更 是 深 陷 “信任 危 
机 ”， 受 到 一 些 挑剔 的 期 刊 和 审 稿 人 的 歧视 ， 成 为 
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学 界 对 共同 方法 变异 失衡 态度 的 一 个 缩影 ， 这 对 
曾 极 大 推动 心理 学 科学 化 进程 的 问卷 法 来 说 不 益 
Ay — FH at RE AY Bf SE (Kline, Sulsky, & Rever- 
Moriyama, 2000)。 同 源 偏 差 的 “罪名 ”一 旦 “ 坐 实 ”， 
不 但 会 动摇 问卷 法 在 社会 科学 研究 方法 体系 中 的 
地 位 ， 还 会 对 心理 和 管理 领域 大 量 依靠 相关 性 研 
究 建 立 起 来 的 理论 构成 极 大 威胁 。 在 批判 浪潮 中 ， 
一 些 学 者 坚守 立场 ， 做 出 了 有 力 的 辩护 ， 反 对 以 
偏 概 全 、 因 嘻 废 食 的 消极 态度 ， 告诫 研 究 者 不 必 
对 共同 方法 变异 过 度 敏 感 。 
3.1 ”自我 报告 法 不 可 替代 

普遍 的 偏见 和 期 刊 的 压力 “ 倒 通 ”研究 者 据 弃 
用 一 张 问卷 获取 所 有 数据 的 简单 设计 ， 转 而 以 外 
部 数据 、 时 间 分 离 等 变通 方法 规避 批评 ， 虽 然 有 
益 于 研究 者 下 决心 改进 研究 设计 , 但 也 不 能 一 概 
将 自我 报告 拒 之 门 外 。 

第 一 , 很 多 构 念 的 测量 仅 适 合 自 我 报告 。 心 
理 和 管理 研究 中 经 常 遇 到 与 认 知 、 态 度 、 情 感 、 
价值 观 、 意 愿 等 有 关 的 自我 参照 (self-referential) 
变量 ,它们 更 多 指向 受 测 者 的 内 心 感受 而 不 是 客 
观 环境 或 实际 行为 ,只 有 借助 个 人 内 省 和 自我 报 
告 才 能 有 效 测 量 ， 其 他 来 源 数据 的 准确 性 难以 保 
证 (Edwards, 2008; Podsakoff et al., 2013; IF H ak, 
2015)。 例如 抑郁 情绪 往往 是 内 隐 而 缺乏 公开 表露 
的 ， 只 有 本 人 能 确切 了 解 自己 的 情绪 状态 ， 故 多 
为 自 评 ， 相 反 如 果 让 教师 来 评定 学 生 的 抑郁 水 平 
就 可 能 出 现 较 大 偏差 (George & Pandey, 2017). 

第 二 ， 自 我 报告 对 探索 性 研究 有 重要 价值 。 在 
提出 和 验证 某 一 理论 假说 的 过 程 中 ,研究 者 往往 
先 编制 测量 工具 将 构 念 操作 化 , 进而 在 理论 指引 
下 开展 多 变量 相关 研究， 此 时 采用 自我 报告 法 同 
时 测量 多 个 构 念 并 考察 其 关系 是 合理 的 做 法 
(Brannick et al., 2010; Reio, 2010)， 可 以 高 效 而 经 济 
地 识别 与 焦点 构 念 有 密切 联系 的 前 因 和 后 果 变 量 ， 
以 此 充实 和 完善 理论 ; 但 如 果 仪 为 减 小 共同 方法 偏 
差 而 盲目 采用 多 来 源 数 据 , 一 旦 构 念 间 的 相关 不 
显著 , 理论 的 建构 进程 就 会 遭受 挫折 , 一 个 颇具 现 
实 解释 力 的 新 理论 可 能 就 此 被 搁置 ,得 不 偿 失 。 


说 明 自 我 报告 远 不 是 获得 显著 相关 性 的 保证 。 总 
Z, 正如 “不 能 把 婴儿 与 洗澡 水 一 起 倒 掉 ”， 不 应 
在 未 经 确证 的 情况 下 不 加 区 分 地 拒绝 自我 报告 研 
究 ， 更 不 可 将 其 “妖魔 化 ”。 
3.2 ”独立 数据 来 源 不 是 “救命 稻草 ” 

独立 数据 来 源 指 独立 于 受 测 者 自我 报告 的 外 
部 数据 来 源 ， 可 分 为 两 类 : 一 是 为 研究 中 的 不 同 
构 念 分 配 不 同 的 评定 者 ， 比 较 典 型 的 是 员工 - 主 
管 配对 和 儿童 -父母 配对 ; 二 是 采用 现成 的 档案 
记录 (如 考试 成 绩 、 缺 勤 次 数 )， 即 二 手数 据 。 作 为 
自我 报告 的 替代 方法 ， 独立 数据 的 引入 从 根本 上 
消除 了 单一 数据 来 源 这 个 最 大 的 困扰 ， 受到 学 者 
的 普遍 欢迎 ， 被 认为 是 最 直接 、 最 彻底 的 解决 方 
案 (Chang et al., 2010; Favero & Bullock, 2015; 
Pace, 2010; Podsakoff et al., 2013)。 然 而 ， 独 立 数 
据 来 源 真 的 是 治愈 “瘟疫 ”的 一 剂 良药 吗 ? 也许 不 
尽 然 ,因为 来 自 外 部 评定 者 的 数据 的 效 度 不 总 是 
令 人 满意 。 其 一 , 评定 者 如 果 对 评定 对 象 不 够 了 
解 或 掌握 的 信息 较为 片面 , 评定 结果 可 能 脱离 实 
际 。 他 人 评定 和 自我 报告 结果 存在 很 大 出 入 的 情 
况 并 不 鲜 见 ， 而 且 不 同 主体 的 评价 都 带 有 实质 性 
信息 ， 难 以 判定 哪个 更 准确 (Spector & Brannick, 
2009)。Spector 等 的 一 项 研究 很 能 说 明 问 题 ， 他 们 
得 到 了 一 个 “反常 ”的 结果 :与 员工 自 评 相 比 ， 当 员 
工 的 反 生 产 行 为 和 组 织 公 民 行 为 都 由 主管 评定 时 ， 
其 相关 性 反而 更 强 。 他 们 的 解释 是 ， 反 生产 行为 
通常 比较 隐秘 ， 主 管 难 以 发 现 , 组 织 公 民 行 为 则 
较为 公开 而 易于 识别 ， 两 类 行为 信息 准确 性 的 不 
对 等 使 主管 无 法 像 员 工本 人 那样 清晰 地 将 二 者 区 
分 开 来 ,造成 相关 系数 的 膨胀 (Spector Bauer, & 
Fox, 2010)。 可 见 ， 反 生产 行为 这 类 透明 度 不 高 的 
行为 不 适合 他 评 。 其 二 , 他 人 评定 看 似 消除 了 同 
源 偏差 . 但 本 质 上 仍 是 自我 报告 ,无 法 根除 所 有 
方法 偏差 .特别 是 题 项 层面 的 某 些 偏 差 (Edwards,， 
2008; Meier & O’Toole, 2013) 和 同一 组 织 成 员 的 
知觉 趋同 ( 苏 中 兴 , 段 佳 利 2015), H=, 非 同 源 
数据 的 匹配 过 程 大 多 伴 有 样本 损耗 ， 还 可 能 引入 
取样 偏差 ， 例 如 员工 只 有 在 预期 能 够 得 到 积极 的 


“都 市 传说 ”的 宣扬 者 Spector (2006) 还 辩解 道 ， 
如 果 自 我 报告 都 带 有 同 源 偏差 .应 存在 一 个 确保 
所 有 观测 相关 系数 达到 统计 显著 性 的 基线 水 平 ， 
但 实际 情况 是 ， 即 使 在 大 样本 研究 和 具有 理论 关 
联 的 构 念 间 , 不 显著 的 相关 仍 十 分 常见 ， 这 充分 


绩效 评价 或 与 主管 关系 良好 时 ， 才 会 把 配套 问卷 
交 给 主管 填写 (e.g.，Carter, Mossholder, Field, & 
Armenakis，2014)。 此 外 , 模拟 研究 表明 ， 由 于 错 
失 了 一 些 实质 性 变异 ， 多方 评定 同样 会 导致 结果 
mfr, JAS EG A RIR E ME WA (Kammeyer-Mueller, 
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Steel, & Rubenstein, 2010)。 

二 手数 据 虽 比较 客观 , 不 易 摊 杂 自我 报告 的 
主观 腾 断 因素 , 但 有 些 档案 数据 的 采集 过 程 不 够 
公开 透明 ， 如 同一 个 “黑箱 ”缺乏 研究 者 的 主动 
控制 ; 数据 可 能 因 人 为 操纵 (如 有 选择 地 记录 、 删 
除数 据 ) 而 失真 ， 无 法 保证 质量 ,非常 欢迎 此 类 数 
据 的 审 稿 人 一 般 也 不 会 详 加 审查 (George & 
Pandey, 2017)。 显 然 ， 这 些 都 是 潜在 的 “污染 源 ”。 

归结 起 来 ,独立 数据 来 源 虽 然 可 以 消除 大 部 
分 共同 方法 变异 ， 有 其 优势 ， 但 绝 非 无 懈 可 击 ， 
如 果 评 定 者 无 法 做 出 客观 、 准 确 的 评定 或 二 手数 
据 失 真 ， 同 样 会 造成 严重 的 偏差 。 独 立 数据 来 源 
无 需 过 度 吹 拱 ， 也 不 能 完全 取代 自我 报告 。 

3.3 ”共同 方法 偏差 的 检测 方法 存在 缺陷 

如 前 所 述 ,检测 共同 方法 偏差 的 基本 思路 是 
比较 具备 不 同方 法 特征 的 两 个 构 念 的 相关 性 ， 设 
置 了 使 用 不 同 测量 方法 的 多 个 “实验 ”组 。 这 种 方 
法 表面 上 比较 严 首 ,得 出 的 结论 也 有 理 有 据 , 但 
若 细 加 思量 ， 又 不 难 发 现 其 中 的 漏洞 。 其 一 ， 比 较 
法 的 一 个 关键 假设 是 , 采用 多 种 方法 得 到 的 结 
不 存在 共同 方法 偏差 ， 比 单一 方法 的 结果 准确 。 
在 构 念 间 的 真实 相关 系数 无 从 知晓 的 情况 下 ， 多 
方法 组 的 相关 系数 被 默认 为 真 值 的 近似 值 。 然 而 ， 
这 个 “标尺 ”不 一 定 靠得住 ， 因 为 多 方法 组 的 结果 
可 能 很 不 准确 ， 不 能 作为 比较 标准 (Schaller et al., 
2015). Lance, Dawson, Birkelbach 和 Hoffman 
(2010) 证 明 , 在 MTMM 模型 中 , 方法 的 相关 性 会 
影响 构 念 的 相关 性 ， 只 要 方法 效应 显著 (各 指标 在 
相应 方法 因子 上 的 负荷 不 为 0)， 且 方法 之 间 为 正 
相关 ,观测 相关 系数 就 会 发 生 膨胀 。 不 幸 的 是 ,元 
分 析 恰 恰 发 现 ,方法 之 间 大 多 具有 正 相 关 ， 因 此 
用 不 同方 法 测量 的 构 念 间 的 观测 相关 系数 一 般 也 
带 有 偏差 ; 严格 来 说 ， 只 有 在 方法 相关 为 0 的 前 
提 下 ， 比 较 单 一 方法 与 多 方法 的 结果 才能 评估 共 
同方 法 偏差 。 如 此 严 匣 的 条 件 在 实际 研究 中 几乎 
不 可 能 满足 ， 与 有 偏 结 果 的 比较 也 就 没 多 少 意义 
了 。 其 二 , 虽然 设置 了 多 个 “实验 "组 并 操纵 了 个 别 
方法 特征 , 但 过 程控 制 远 不 如 真实 验 那 样 严 格 ， 
存在 不 少 可 能 污染 研究 结果 的 无 关 变 量 ， 比 较 突 
出 的 是 测量 情境 和 媒介 。 例如 在 Johnson 等 (2011) 
的 研究 中 , 同一 组 受 测 者 有 的 接受 纸 笔 测验 ， 有 
的 填写 网 络 问卷 ,其实 这 本 身 就 属于 不 同 的 方法 ， 
会 影响 受 测 者 的 反应 方式 (Weijters，Schillewaert， 


& Geuens, 2008)， 研 究 者 却 未 予 控制 。 再 者 ， 由 于 
大 多 采用 方便 取样 法 ， 难 以 随机 分 配 被 试 ， 且 没 
有 通过 前 测 来 比较 各 组 在 接受 “实验 处 理 " 前 是 否 
处 于 同一 基线 水 平 (实际 也 不 可 行 ), 不 易 保 证 各 
组 为 同 质 组 ,也 就 无 法 确定 各 组 相关 系数 的 差异 
有 多 少 是 由 不 同方 法 特征 引起 的 。 
一 言 以 项 之 ， 比 较 法 的 结果 往往 夸大 了 共同 
方法 偏差 , 说 服 力 不 高 ， 应 慎重 对 待 。 
3.4 测量 误差 的 抵消 作用 
虽然 题 项 观测 分 数 的 变异 包含 3 种 成 分 , 但 
多 数 研究 者 只 关心 方法 变异 和 特质 变异 的 相对 大 
小 ,并 习惯 性 地 将 测量 误差 当做 可 有 可 无 的 成 分 
而 不 予 分 析 。 其 实 误差 变异 在 总 变异 中 的 比例 也 
相当 可 观 (Lance et al., 2010; Podsakoff et al., 
2012)， 不 应 “选择 性 ”忽视 。Lance 等 (Brannick et 
al., 2010; Lance et al., 2010) 认 为 , 测量 误差 是 信 
度 不 足 (unreliability， 指 信 度 系数 低 于 1 的 程度 ) 的 
同义词 , 与 构 念 间 的 观测 相关 系数 和 共同 方法 偏 
差 有 直接 关联 。 一 般 地 , 假设 两 个 构 念 X 和 了 采 
用 了 同一 测量 方法 ,其 相关 系数 的 观测 值 rxy 可 表 
示 为 特质 效应 和 方法 效应 之 和 : 


rxy = Aq, Mr, Prt, + Nm Am, (1) 


HP, Ar, MAr 分 别 代表 XX 和 了 的 信和 度 系 数 ， 
Prr, 代表 关 和 YY 的 真实 相关 系数 ，Xy 和 Xm 分 
别 代 表单 一 测量 方法 M 对 X 和 了 的 效应 。 从 中 可 
以 看 出 , 和 和 了 的 观测 相关 因 方 法 效应 项 yy Am, 
发 生 膨 胀 ， 导 致 共同 方法 偏差 ; 同时 ， 由 于 和 和 了 
信 度 系数 的 乘积 Ar Ar 远 小 于 1 (如 在 0.8 的 常规 
信和 度 水 平 下 , 该 项 等 于 0.64)， 相 关系 数 会 因此 发 
生 缩 减 (attenuation)。 两 项 相 加 后 ， 观 测 相 关系 数 
的 兆 效 应 有 三 种 情况 : a. 高 于 真 值 (膨胀 大 于 缩减 
时 ); b. 低 于 真 值 (膨胀 小 于 缩减 时 ); cP 
胀 等 于 缩减 时 ) (Conway & Lance, 2010)。 这 提示 ， 
测量 误差 的 “中 和 ”作用 有 望 使 观测 相关 不 过 度 偏 
离 真 值 ， 从 而 将 共同 方法 偏差 控制 在 较 低 程度 。 

Lance 等 (2010) 对 18 个 MTMM 和 矩阵 的 再 分 析 
为 此 提供 了 佐证 。 采 用 相同 方法 测量 的 两 个 构 念 
的 平均 观测 相关 系数 为 0.340, 通过 (1) 式 换算 得 
到 的 相关 系数 为 0.332， 二 者 极为 接近 ; 加 入 方法 
因子 后 ,特质 因子 的 平均 相关 系数 (真实 相关 系数 
Prr, 的 无 偏 估计 值 ) 为 0.371, 与 前 两 个 值 的 差异 
也 不 太 大 。 他 们 由 此 得 出 结论 (p.444):““ 共 同方 
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法 效应 使 单一 方法 得 到 的 相关 系数 膨胀 ;这 一 “都 
市 传说 "有 几 分 道理 , 但 相关 系数 大 于 其 真 值 则 是 
个 谣言 ， 这 是 由 于 测量 误差 具有 削减 效应 。” 在 

另 一 项 模拟 研究 中 ，Fuller 等 (2016) 操 纵 了 共同 方 
法 变异 比例 、 信 和 度 、 真 实 相 关系 数 等 参数 ， 发 现 
在 信和 度 略 低 于 常规 水 平 (0.77~0.80) 时 ， 共 同方 法 
变异 会 导致 相关 系数 的 紧缩 ; 相反 , 在 信和 度 极 高 
(0.97~0.99) 时 ， 共 同方 法 变异 会 导致 相关 系数 的 
膨胀 。 这 很 好 地 支持 了 Lance 等 的 观点 : 共同 方 
法 变异 虽然 存在 , 但 能 否 引 起 显著 的 共同 方法 偏 
差 部 分 取决 于 测量 误差 的 削减 作用 ; 在 特定 情况 
下 (方法 的 膨胀 效应 恰好 被 测量 误差 的 削减 效应 
完全 抵消 )， 由 单一 方法 求 得 的 相关 系数 能 够 准确 
地 反映 构 念 间 的 真实 关系 。 

这 一 论点 是 对 “致命 总 疫 ” 说 的 有 力 回 击 ， 有 
较 扎 实 的 理论 和 实证 依据 , 但 Lance 本 人 也 承认 ， 
它 还 没有 得 到 学 界 的 广泛 认同 。 且 不 论 其 他 问题 ， 
这 种 解释 首先 与 人 们 的 常识 相悖 : 较 高 的 信 度 本 
应 是 研究 力图 达到 的 理想 状态 , 却 同时 削弱 了 测 
量 误差 的 抵消 作用 ,助长 了 相关 系数 的 膨胀 ， 换 
言 之 , 信和 度 越 高 ， 共 同方 法 偏差 反而 越 大 , SA 
困惑 。 学 者 还 提出 了 其 他 异议 。Favero 和 Bullock 
(2015) 认 为 ， Lance 等 的 解释 不 适用 于 构 念 间 的 真 
实 相关 为 0 的 情况 ， 因 为 此 时 观测 相关 系数 不 可 
能 再 被 前 减 ， 只 会 因 共 同方 法 变异 而 膨胀 , — H. 
其 绝对 值 显著 大 于 0， 就 出 现 了 假 阳性 结果 ， 这 
种 OL 型 错误 是 研究 者 极力 规避 的 ; 至 于 真实 相关 
和 观测 相关 都 显著 不 为 0 时 ,削减 效应 和 膨胀 效 
应 的 相对 大 小 至 多 会 改变 相关 系数 的 估计 值 而 不 
太 可 能 影响 显著 性 (使 原本 显著 的 相关 变 为 不 显 
著 ), 不 是 太 要 紧 。Meier 和 O’Toole (2013) 提 醒 ， 
即使 测量 误差 有 抵消 膨胀 效应 的 潜力 ， 也 不 意味 
着 可 以 无 视 共 同方 法 偏差 .因为 不 同学 科 、 不 同 
研究 乃至 不 同 构 念 间 的 共同 方法 变异 量 有 很 大 差 
异 , 在 共同 方法 变异 风险 较 高 的 研究 中 ,抵消 效 
果 可 能 不 理想 , 无 法 完全 排除 共同 方法 偏差 。 诚 
如 此 言 , 不 是 所 有 研究 都 能 得 到 Lance 等 那样 完 
美和 巧合 的 结果 ,膨胀 量 和 削减 量 恰好 相等 也 许 
只 是 个 小 概率 事件 , 不 太 具 有 普遍 性 。 尽 管 如 此 ， 
Lance 等 的 初步 探索 使 我 们 领会 了 信和 度 和 测量 误 
差 的 男 一 层 意蕴 ,很 有 启示 性 。 
3.5” 非 共同 方法 变异 与 共同 方法 变异 的 消长 

Conway 和 Lance (2010) 将 “他 评 优 于 自 评 ” 列 


at 


为 审 稿 人 对 共同 方法 偏差 的 三 大 误解 之 一 ， 因 为 
来 自 不 同 评定 者 ( 推 而 广 之 ， 其 他 不 同方 法 特征 ) 
的 评分 会 产生 非 共享 方法 效应 或 非 共 享 无 关 变 异 
(unshared irrelevant variance)， 造 成 构 念 相关 性 的 
缩减 (Brannick et al., 2010)。“ 非 共享 方法 效应 ”的 
提出 隐 含 了 一 种 视角 的 转换 ， 即 在 关注 测量 方法 
的 共同 点 或 相似 性 之 余 ， 也 应 留意 方法 之 间 的 差 
异性 ， 因 为 这 是 共同 方法 变异 的 潜在 制衡 因子 。 
受 此 启发 ，Spector 等 (Spector, Rosen, Richardson, 
Williams, & Johnson, in press) 对 方法 变异 做 出 了 
更 全 面 的 界定 ,认为 方法 变异 是 作用 于 被 测 变量 
的 外 生 的 、 意 料 之 外 的 (unintended) 系 统 性 影响 ， 
其 中 一 部 分 为 多 个 变量 所 共享 ， 即 共同 方法 变异 ; 
另 一 部 分 单独 影响 个 别 变量 ， 互 不 重 至 ， 称 为 非 
共同 方法 变异 (uncommon method variance)。 共 同 
方法 变异 和 非 共 同方 法 变异 互补 ,共同 构成 总 的 
方法 变异 (各 种 变异 成 分 的 关系 见 图 1), 它们 相 辅 
相 成 、 密 不 可 分 ， 又 相互 制约 、 此 消 披 长 ; 不 论 一 
项 研究 中 的 共同 方法 变异 是 否 显著 、 量 有 多 大 ， 
必然 存在 一 定量 的 非 共同 方法 变异 ， 因 为 各 构 念 
的 测量 方法 或 多 或 少 有 一 些 差 异 。 从 另 一 个 角度 
看 ,不 同方 法 间 的 相关 性 越 高 ， 共 同方 法 变异 越 
大 ; 相关 性 越 低 ， 非 共同 方法 变异 越 大 。 

这 样 ， 题 项 观测 分 数 的 变异 可 分 解 为 

Vo =Yc +) Vuy, +Vg (2) 

其 中 Vo 是 总 变异 , Ve oe SAU HH FA 2 AS | 
的 变异 ，VWw 是 各 种 方法 特征 Mi 引起 的 方法 变异 ， 
Vs 是 误差 变异 。 XVu 就 等 于 共同 方法 变异 和 非 
共同 方法 变异 之 和 。 

韭 共 同方 法 变异 属于 系统 误差 , 与 测量 误 
差 和 信和 度 不 足 不 是 一 回 事 ,但 有 类 似 的 功能 。 单 
独 来 看 ， 它 会 减弱 构 念 的 相关 性 ， 降 低 效果 量 ， 
扭曲 复杂 统计 技术 的 佑 计 结 果 ， 导致 TT 型 错误 。 
实际 研究 中 两 类 方法 变异 并 存 ， 情 况 会 复杂 一 
些 。 两 个 构 念 X 和 了 的 观测 相关 系数 rxy 在 数量 
上 等 于 


eee Covyy 6) 
x Var, Var, 

先 看 等 号 右边 的 分 子 。 不 考虑 测量 误差 , 由 

于 X 和 了 的 系统 变异 均 包 含 构 念 变异 和 方法 变异 
两 项 ， 则 其 协 方差 等 于 四 部 分 之 和 


Covyy =Covy y +Covy y, +Covy y +Covy y (4) 
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其 中 下 标 C 代表 构 念 , 下 标 M 代表 方法 。 通 
常 默认 构 念 与 方法 之 间 无 交互 效应 (加 法 效应 模 
型 ) (Doty & Glick，1998)， 即 (4) 式 等 号 右边 的 第 
二 项 和 第 三 项 等 于 0; 第 四 项 表示 的 就 是 共同 方 
法 变异 , 在 XX 和 YY 采用 同一 测量 方法 时 显著 大 于 
0， 从 而 总 体 协 方差 增 大 ,造成 观测 相关 系数 的 脱 
Ak; 如 果 测 量 方法 不 同 ， 则 第 四 项 等 于 02 XA Y 
的 协 方差 不 会 增 大 , 但 非 共 同方 法 变异 的 存在 将 
致使 X 和 了 自身 的 系统 变异 增 大 ， 从 而 (3) 式 等 号 
右边 的 分 母 增 大 ， 导致 观测 相关 系数 的 缩减 。 可 
见 , 方法 变异 对 观测 相关 系数 的 净 效 应 取决 于 两 
类 方法 变异 的 相对 大 小 以 及 (3) 式 中 分 子 和 分 母 的 
相对 变动 程度 。 

以 上 分 析 可 以 看 出 , 非 共 同方 法 变异 有 两 
方面 的 意义 : 其 一 ， 如 果 两 个 构 念 的 测量 方法 相 
同 ， 它 和 测量 误差 的 双重 削减 作用 将 抑制 共同 方 
法 偏差 ' 其 二 ， 如 果 测 量 方法 不 同 , 则 非 共同 方 
法 变异 数量 较 大 , 使 构 念 间 的 实质 性 共 变 (图 1 中 
的 A 区 域 ) 在 总 变异 中 的 比例 减 小 ,造成 相关 系数 
的 低估 。Spector 等 认为 ,不同 的 数据 来 源 尤 其 容 
易 引 入 非 共同 方法 变异 ， 这 就 可 以 解释 为 何 主管 
评定 的 团队 绩效 和 员工 评定 的 领导 风格 的 相关 系 
数 可 能 低 于 真实 值 ， 成 为 “采用 多 种 测量 方法 得 
到 的 相关 系数 是 真实 相关 系数 的 无 偏 估计 值 ” 的 
又 一 反驳 论点 。 


图 1 构 念 总 变异 的 分 解 


TE: A- 实 质 性 共 变 , B- 独 特 无 关 变 异 , C- 测 量 误差 变异 , D- 
同方 法 变异 , E- 非 共同 方法 变异 ; D 和 之 和 为 方法 变异 ， 
A 和 DD 之 和 决定 了 两 个 构 念 的 观测 相关 系数 大 小 


Spector 等 在 共同 方法 变异 之 外 提出 具有 对 
立 性 质 的 非 共 同方 法 变异 ， 颇 有 针锋相对 的 意 
味 。 虽 然 这 一 学 说 还 是 尝试 性 的 ， 尚 缺乏 实证 证 


2 Spector 等 的 这 一 论断 略 显 轻率 ,因为 Lance 等 (2010) 的 元 
分 析 表明 不 同方 法 间 大 多 存在 正 相关 , 其 协 方差 一 般 不 为 0。 


据 , 但 把 人 们 对 方法 变异 的 认识 推进 了 一 步 ， 有 
助 于 厘清 方法 变异 与 共同 方法 变异 的 关系 ,突破 
将 二 者 等 同 起 来 的 简单 化 理解 。 非 共同 方法 变异 
与 Lance 等 的 测量 误差 抵消 说 相得益彰 ， 这 两 种 
观点 都 能 较 好 地 解释 共同 方法 偏差 何 时 表现 为 脱 
胀 、 何 时 表现 为 紧缩 ， 对 “自我 报告 有 严重 的 共同 
方法 偏差 "和 “多 方 评定 不 存在 共同 方法 偏差 ”的 
惯常 思维 发 起 了 挑战 ， 是 值得 肯定 的 有 益 探索 。 


4 方法 不 代表 一 切 : 以 测量 为 中 心 的 新 

视角 

“批判 派 ” 和 “辩护 派 ” 你 来 我 往 的 交锋 使 我 们 
一 时 难以 对 共同 方法 变异 的 威胁 下 一 个 定论 。 或 
许 ， 这 样 一 个 普 适 的 定论 原本 就 不 存在 ， 只 有 更 
加 精细 地 看 待 共同 方法 变异 ， 才 能 找到 正确 的 应 
对 途径 。 研 究 者 普遍 带 有 这 样 的 迷 思 : 想当然 地 
将 共同 方法 变异 与 某 种 测量 方法 “挂钩 ” 认为 只 
要 几 个 构 念 都 采用 了 这 种 方法 ， 就 免不了 受到 污 
染 ; 或 者 说 ,共同 方法 变异 的 唯一 诱发 因素 是 方 
法 , 与 被 测 构 念 无 关 。, 在 此 驱动 下 ， 面 对 一 篇 完全 
采用 自我 报告 法 的 论文 人 们 往往 会 揪 住 共同 方 
法 变异 问题 不 放 , 却 对 其 中 的 变量 特征 和 自我 报 
告 的 适当 性 失 之 详 查 。 

这 一 观念 的 偏颇 之 处 在 于 ， 只 看 到 方法 在 共 
同方 法 变异 形成 中 的 作用 ， 制 裂 了 方法 与 构 念 有 
联系 。Spector (2006) 强 调 ， 认 为 用 某 一 方法 测量 
的 所 有 构 念 都 自动 地 带 有 一 些 普遍 性 的 共享 变异 ， 
是 一 种 夸大 和 过 度 简 单 化 的 理解 : “我们 需要 对 共 
同方 法 变异 进行 更 加 细致 的 思考 ， 作 者 和 审 稿 人 
都 不 应 条 件 反 射 式 地 批判 共同 方法 变异 或 单一 方 
法 偏差 。 应 当 握 弃 (retire) 共 同方 法 变异 这 个 术语 
及 其 衍生 物 ， 转 而 思考 特定 的 偏差 和 变量 关系 可 
能 的 蔡 代 性 解释 。”(p.231)* 握 弃 ” 不 是 拒绝 承认 共 
同方 法 变异 的 存在 ， 而 是 说 不 应 夸大 其 在 不 同 构 
念 组 合 中 的 普遍 性 。 根 据 前 述 实 证 结果 ， 共 同方 
法 变异 和 共同 方法 偏差 的 大 小 在 不 同学 科 和 不 同 
构 念 组 合 中 有 很 大 差异 ， 这 充分 说 明 ， 共 同方 法 
变异 不 能 完全 归咎 于 某 种 方法 ， 而 是 测量 方法 和 
被 测 构 念 交互 作用 的 产物 ， 也 可 以 说 是 方法 和 构 
念 的 函数 (Williams, Hartman, & Cavazotte, 2010). 
共同 方法 变异 不 是 出 现在 方法 水 平 ， 而 是 出 现在 
构 念 水 平 ， 构 念 的 性 质 不 同 ， 采 用 同一 方法 测量 
的 不 同 构 念 组 合 的 共同 方法 变异 风险 也 不 同 。 例 
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变量 性 质 一 高 风险 
* 感 知 、 情 绪 、 态 度 类 
+ 抽象 、 模 糊 、 容 易 引 起 个 性 化 理解 


* 社 会 赞许 性 较 高 
TBE | BBR 
测量 方法 一 低 风 险 测量 方法 一 高 风险 
+ 多 来 源 (独立 数据 源 ) >  * 单 一 来 源 (自我 报告 ) 
*# 时 间 分 离 * 横 断 调查 (单一 时 间 点 ) 
* 不 同 量 表格 式 和 /或 选项 * 单 一 量 表格 式 和 /或 选项 
MERE VPERR 
变量 性 质 一 低 风 险 
+ 行为、 事实 类 
* 具 体 、 清 晰 、 无 歧义 
* 社 会 赞许 性 较 低 
图 2 共同 方法 变异 风险 评估 坐标 系 
表 1 共同 方法 变异 风险 评估 计 分 规则 
风险 源 评分 范围 说 明 
方法 维度 
数据 来 源 -4~4 ”完全 自我 报告 计 4 分, 数据 来 源 不 同 计 -4 分 
测量 时 间 -3~3 ”一 次 性 完成 计 3 分 ; 时 间 间 隔 越 长 , 评分 越 低 ， 如 间隔 2 天 可 计 -1 分 ,间隔 1 周 可 计 -2 分 
量 表 格式 和 选项 -22 ”两 个 变量 采用 完全 相同 的 格式 和 选项 , 计 2 分 ; 差异 越 大 , 评分 越 低 
变量 维度 
是 否 属于 感知 类 -22 ”两 个 变量 均 为 感知 类 变量 , 计 2 分 ; 至 少 一 sachs rages 计 -2 分 
抽象 性 -2~2 ”两 个 变量 都 非常 抽象 或 模糊 , 计 2 分 ; 至 少 一 个 比较 具体 ， 计 -2 分 
社会 赞许 性 -2~2 ”两 个 变量 都 有 明显 的 社会 赞许 性 ， 计 2 分 ; a 一 个 社会 赞许 性 较 低 , 计 -2 分 
如 ,自我 报告 可 能 en ae 法 变异 风险 及 其 来 源 , 识别 最 有 可 能 受到 污染 的 
却 未 必 使 一 个 事实 类 变量 (如 年 龄 等 人 口 统计 学 变量 组 合 。 遵循 这 一 思路 ,我 们 认为 ,可 以 将 主要 


i ee : 量 的 关系 发 生 偏 倚 ， 这 是 因 
为 事实 信息 较 少 因 测 量 方法 产生 偏差 。 这 就 是 以 
测量 为 中 心 (measure-centric) 的 视角 ， 它 假设 对 每 
一 构 念 的 操作 化 (方法 与 特质 的 结合 ) 都 带 有 一 些 
独特 的 偏差 2 如 果 多 个 构 念 的 操作 化 各 自 携带 的 
有 差 有 交 又 重重 之 处 , 才 有 可 能 产生 共同 方法 偏 
差 (Brannick et al., 2010; Spector, 2006; Spector et 
al., in press). 

以 测量 为 中 心 的 视角 对 研究 者 和 审 稿 人 的 启 
示 是 , 不 宜 大 而 化 之 地 将 共同 方法 变异 作为 研究 
中 的 普 这 问题 ,应 具体 分 析 每 一 对 变量 的 共同 方 


括 方法 偏差 ， ee ne 的 偏差 ， 
如 第 三 变量 (third variables)。 


的 共同 方法 变异 风险 源 划 分 为 变量 和 方法 两 个 维 
BE, eee hee SH H K 
来 源 、 是 否 在 同一 时 间 测 量 、 是 否 使 用 了 相同 的 
量 表格 式 和 选项 等 BE 量 维度 的 关键 素 包 括 是 
否 属于 感知 类 变量 、 抽 象 性 、 社 会 赞许 性 等 。 以 方 
法 引起 的 风险 为 横 轴 ， 以 变量 引起 的 风险 为 纵 轴 ， 
可 形成 “共同 方法 变异 风险 评估 坐标 系 ” 如 图 2。 
A es. 具有 预测 与 被 预测 关系 
joes ， 都 可 以 参照 该 坐标 系 , 通过 评估 两 
个 变 变量 在 方法 和 变量 维度 相应 各 关键 要 素 上 的 相 
me A LA 变异 风险 。 为 提高 评估 
结果 的 精确 性 ， 可 以 根据 现 有 研究 结果 和 个 人 经 
验 ， 对 每 一 要 素 分 别 评分 ， 考 虑 到 各 要 素 的 影响 
力 (权重 ) 不 同 ,评分 范围 也 各 不 相同 ， 详 见 表 1 
(得 分 越 高 表示 风险 越 大 )。 分 别 计算 两 个 维度 的 总 
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分 , 确定 该 点 在 坐标 系 中 的 位 置 ， 即 可 初步 了 解 
该 变量 组 合 受 共同 方法 变异 的 影响 程度 ; 以 此 类 
HE, 还 可 计算 所 有 焦点 变量 组 合 得 分 的 平均 分 ， 
评估 整 项 研究 的 共同 方法 变异 风险 。 

该 方法 为 细致 评估 特定 研究 中 的 共同 方法 变 
异 提供 了 一 种 思路 ， 既 有 助 于 研究 者 预 判 共同 方 
法 变异 来 源 并 采取 针对 性 的 控制 手段 , 也 有 助 于 
审 稿 人 有 理据 地 做 出 评价 ， 而 不 是 泛泛 地 批评 
“该 研究 有 严重 的 共同 方法 偏差 问题 "。 当 然 ， 这 套 
评估 体系 还 非常 粗糙 ， 纳 入 的 方法 要 素 、 权 重 等 
有 很 多 可 商检 之 处 ; 准确 的 评分 有 赖 于 对 共同 方 
法 变异 的 深刻 理解 和 丰富 实践 经 验 , 不 可 避免 带 
有 主观 性 。 我 们 希望 学 界 同仁 能 够 以 此 为 起 点 ， 
通过 系统 深入 的 研究 提出 真知 灼 见 ,使 其 更 趋 完 
善 、 更 具 可 操作 性 。 


5 总 结 与 建议 


学 界 对 共同 方法 变异 问题 屡 攻 不 克 。 作 为 
Journal of Applied Psychology 自 1990 年 以 来 发 表 
的 影响 最 为 深远 的 方法 学 文献 之 一 (Cortina， 
Aguinis, & Deshon, 2017), Podsakoff 等 (2003) 的 里 
程 碑 式 综述 “促使 众多 学 者 重视 共同 方法 变异 并 
全 力 探 寻 解 决 之 策 , 但 “ 攻 “ 守 ”双方 势均力敌 的 
论战 使 “致命 瘟疫 "和 “都 市 传说 "之 争 越发 扑 朔 迷 
离 。 时 至 今日 , 未 解 的 文 团 也 许 远 远 多 于 已 解决 
的 问题 , 更 多 时 候 “ 我 们 未 必 真 正 知道 我 们 认为 
自己 知道 的 ”(Spector et al., 2010), HATHA, 
共同 方法 变异 受到 “ 围 箱 已 成 风气 ， 但 我 们 认为 ， 
在 决定 性 的 、 一 锤 定 音 的 证 据 出 现 之 前 ， 应 采取 
谨慎 和 均衡 的 态度 ， 既 不 能 反应 过 敏 ， 也 不 能 
之 不 理 。 着 眼 于 稳妥 处 理 共同 方法 变异 问题 以 提高 
研究 质量 , 我 们 提出 以 下 粗浅 建议 , 供 同 行 讨论 。 

第 一 ,以 包容 和 开放 的 心态 面 对 共同 方法 变 
异 。 其 实 , 方法 变异 本 是 构 念 的 固有 属性 ， 两 个 构 
念 的 测量 方法 几乎 总 有 相似 的 特征 ， 即 使 采用 程 
序 和 统计 控制 手段 也 很 难 将 共同 方法 变异 完全 吻 
除 ; 况且 有 些 共同 方法 变异 还 触及 构 念 的 实质 成 
分 , 不 都 是 有 害 的 (Lance, Baranik, Lau, & Scharlau, 
2009)。 因 此 ， 可 以 说 共同 方法 变异 的 存在 是 天 然 
合理 .不 可 避免 的 , 不 妨 以 宽容 之 心 接纳 它 ， 没 必 


4 2018 年 11 月 8 日 谷歌 学 术 的 检索 数据 显示 ,该 文 被 引 量 
已 超过 3.2 万 次 。 


要 处 心 积 虑 地 试图 消灭 它 。 我 们 和 希望 学 术 共 同体 
特别 是 审 稿 人 形成 一 种 共识 ， 容 许 共同 方法 变异 
带 来 的 缺憾 ,结合 实际 多 提 有 助 于 改进 研究 设计 
的 建设 性 意见 ， 而 不 是 挥舞 着 共同 方法 变异 这 张 
“王牌 ”一 味 挑刺 。 

53 二， 纠正 对 自我 报告 的 偏见 。 在 普遍 的 “ 效 
度 焦虑 "中 ， 研 究 者 尤其 需要 实事 求 是 地 评估 自 
我 报告 的 短 长 ， 须 知 不 同 的 构 念 组 合 具 有 不 同 的 
共同 方法 变异 “ 易 感性 ” 不 能 不 由 分 说 地 把 一 切 
责任 都 推 给 自我 报告 ,更 不 应 怀 着 “自我 报告 一 
定 受 到 了 共同 方法 变异 的 污染 ”这 类 先 人 为 主 的 
成 见 而 将 其 全 盘 否 定 。 当然, 在 条 件 许可 时 ， 从 不 
同 来 源 获 取 数 据 还 是 值得 推荐 (例如 员工 的 工作 
绩效 最 好 由 主管 来 评定 ), 但 这 是 一 剂 “ 猛 药 ”， 需 
思考 特定 构 念 是 否 适合 他 评 、 他 人 能 否 做 出 准确 
的 评定 以 及 低估 相关 性 的 可 能 , 在 各 类 风险 间 做 
出 权衡 。 在 很 多 情况 下 ， 自 我 报告 仍 是 首选 方法 ， 
如 果 构 念 关联 性 的 理论 基础 坚实 、 观 测 相关 系数 
较 大 (如 大 于 0.5)、 构 念 含义 较为 具体 或 多 涉及 可 
观察 的 行为 、 数 据 质量 较 高 ( 信 效 度 高 ) 则 共同 方 
法 变异 的 威胁 相对 较 小 (Batista-Foguet, Revilla, Saris, 
Boyatzis, & Serlavós, 2014; Rindfleisch, Malter, 
Ganesan, & Moorman，2008)， 至 少 不 太 容易 出 现 
研究 者 最 担心 的 假 阳性 ; 但 如 果 研 究 中 的 自我 参 
照 式 感知 构 念 较 多 、 相 关系 数 刚刚 达到 显著 水 平 、 
题 项 语义 模糊 抽象 、 施 测 过 程 中 出 现 干扰 因素 或 
受 测 者 不 够 配合 ， 就 面临 着 较 大 的 共同 方法 变异 
风险 。 需 要 解释 的 是 ,与 偏 高 的 相关 系数 相 比 ,更 
值得 警惕 的 是 绝对 值 较 低 或 恰好 达到 p < 0.05 的 
“门槛 ?的 相关 系数 ， 因 为 如 果 这 是 由 共同 方法 变 
异 引起 的 ， 就 意味 着 两 个 原本 没有 关联 的 构 念 具 
有 了 伪 相关 性 ,会 对 后 续 研 究 产 生 强 烈 误 导 。 总 
而 言 之 ， 自 我 报告 仍 有 很 大 价值 ， 绝 非 一 无 是 处 ; 
采用 多 源 数据 时 要 评估 适合 性 ， 还 要 承担 引入 其 
他 偏差 之 风险 ,两 害 相 权 取 其 轻 。 

第 三 ,改进 补救 策略 。 为 增强 研究 结果 的 稳 
健 性 ， 进 行 适当 的 控制 或 补救 还 是 有 必要 的 。 最 
根本 的 是 做 好 研究 设计 ， 预 先 对 变量 和 拟 采 用 的 
测量 方法 进行 整体 分 析 , 识别 共同 方法 变异 来 源 ， 
从 资料 收集 的 分 离 策略 和 测量 工具 的 改进 两 端 着 
F(A, eR, FRH, BRE, ES, 
2012; BAIS, 2006), 制订 系 统 的 解决 方案 ， 
综合 运用 时 间 分 离 、 变 换 量 表 选 项 、 使 用 反 向 计 
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分 题 、 优 化 题 项 文字 表述 、 删 除 不 同 构 念 中 语义 相 
近 的 题 项 、 争 取 受 测 者 的 配合 等 措施 , 减少 一 致 性 、 
i 差 性 、 敷 衍 性 的 回答 。 需 要 注意 ， 策 略 的 选用 应 
以 排除 混淆 变量 的 影响 以 巩固 因果 关系 为 基点 ， 
依 研 究 的 具体 条 件 而 定 , 不 必 仅 仅 为 了 让 审 稿 人 
满意 而 大 费 周章 地 将 研究 设计 复杂 化 。 例 如 , 虽 
然 时 间 分 离 常 被 推荐 为 有 效 的 方法 (Craighead,， 
Ketchen, Dunn, & Hult, 2011; MacKenzie & Podsakoff, 
2012), 但 带 有 中 介 变 量 的 研究 是 否 需 要 此 类 纵向 
数据 ， 取 决 于 所 要 研究 的 问题 和 变量 ( 温 忠 膀 ， 
2017)， 以 样本 流失 为 代价 去 控制 一 个 可 能 “不 存 
在 的 东西 ”(Brannick et al., 2010) 未 必 明 智 。 在 变 
量 越 来 越 多 、 模 型 越 来 越 复杂 的 趋势 下 ,为 所 有 
变量 指定 不 同 的 评定 者 或 进行 彻底 的 时 间 分 离 是 
不 现实 的 ;,， 建议 研究 者 抓 住 重点 ,根据 我 们 提出 
的 风险 评估 方法 找 出 共同 方法 变异 顾虑 最 大 的 变 
量 组 合 ( 如 两 个 抽象 的 感知 类 变量 ), 将 预防 措施 
用 在 这 些 紧 要 之 处 。 另 一 方面 ， 据 我 们 观察 ， 国 内 
研究 者 大 都 擅长 用 统计 技术 进行 事后 检测 和 控制 
对 研究 设计 和 实施 过 程 中 的 控制 方法 却 着 墨 不 多 ， 
显示 出 重 统计 补救 、 轻 事先 预防 的 不 良 倾向 。 遗 
憾 的 是 ， 多数 统计 技术 不 是 效力 不 高 就 是 有 明显 
次 端 ， 没有 一 种 是 包 治 百 病 的 “万 灵 药 ”, 与 其 说 
能 “亡羊补牢 ”不 如 说 只 是 提供 了 一 种 心理 安慰 
或 “虚假 的 安全 感 ”(Brannick et al., 2010), MIE 
用 ,例如 , 研究 者 最 熟知 、 使 用 也 最 频繁 的 Harman 
单 因子 检验 "不 能 对 共同 方法 偏差 进行 任何 控制 
和 校正 ， 至 多 只 能 粗略 地 检测 共同 方法 变异 ， 而 
且 灵 人 敏 性 极 差 (e.g., Chang et al., 2010; Malhotra et al., 
2017; Tehseen et al., 2017; 刘洋 , 谢 丽 , 2017; 朱 
海 腾 , 2018-06-19)， 建 议 握 弃 这 种 方法 ; 最 好 直接 
测量 并 控制 已 知 的 变异 来 源 (如 社会 赞许 性 、 反 应 
有 问 )， 但 这 远 非 万 全 之 策 。 应 着 记 “ 一 个 周全 的 研 
究 设 计 胜 过 十 个 精巧 的 补救 措施 ”( 彭 台 光 等 ， 


”以 领导 有 效 性 研究 为 例 ， 常 见 做 法 是 由 上 司 评定 结果 变 
量 ( 如 员工 绩效 ), 领导 风格 和 中 介 变 量 由 员工 评定 ， 这样 
同 源 偏差 风险 依旧 存在 ( 自 变量 一 中 介 变 量 间 )， 除非 每 个 
变量 都 来 自 不 同 的 评定 者 ; “彻底 的 时 间 分 离 ” 如 Johnson 等 
(2011) Study 2 中 的 Sample 4 (p.753) 0 X6 I% HH 0X Æ (2016), 
在 实际 研究 中 不 易 实现 。 

E 本文 第 一 作者 对 《心理 学 报 》《 心 理科 学 》《 心 理发 展 与 
教育 》2017 年 发 表 的 128 篇 主要 采用 问卷 法 的 论文 进行 了 
粗略 统计 ， 发现 其 中 96 篇 使 用 了 Harman 单 因子 检验 ， 占 
四 分 之 三 。 相 关 评 论 详 见 朱 海 腾 (2018-06-19)。 


2006, p.91)， 以 改进 研究 设计 为 本 , 减少 对 统计 技 
术 的 依赖 。 

第 四 ， 加强 对 共同 方法 变异 的 基础 研究 。 国 
内 研究 的 荐 乏 很 大 程度 上 限制 了 学 者 对 这 一 问题 
的 理解 ， 而 国外 的 研究 成 果 较 为 丰富 ,大 量 集 j 
在 组 织 和 管理 领域 ， 建 议 多 加 关注 。 其 实 目前 还 
ARAM ARN a, 例如 : 其 一 ， 不 少量 表 含 
有 反 向 计 分 题 有 学 者 建议 在 量 表 验证 阶段 采用 
双 因 子 模型 分 离 由 正 向 / 反 向 表述 带 来 的 方法 变 
异 以 提高 构 念 效 度 (e.g.，Paiva-Salisbury,，Gill, & 
Stickle, 2016; Ai, mE, 2017; KEH, $ 
嘉 ， 赵 清 清 ， 张 进 辅 ，2015), 但 反 向 计 分 题 在 施 
测 时 常 因 作答 者 没 能 正确 理解 而 效果 不 佳 ， 如何 
合理 安排 反 向 计 分 题 的 数量 和 位 置 ,使 之 既 能 前 
减 共同 方法 偏差 又 不 损害 效 度 ? 其 二 ， 当 前 对 共 
同方 法 变异 的 研究 多 限于 双 变 量 简单 相关 ， 其 对 
涉及 中 介 效 应 、 调 节 效 应 的 多 变量 人 研究 (Siemsen,， 
Roth, & Oliveira, 2010; Spector et al., in press) 和 涉 
及 嵌 套 数据 的 多 层次 研究 (Lai et al., 2013) 有 何 影 
W? 这 无 疑 更 引 人 瞩 目 。 其 三 ,在 统计 技术 上 , E 
外 探讨 较 多 的 基于 验证 性 因子 分 析 的 标签 变量 法 
(Williams et al., 2010) 和 新 近 提 出 的 混合 方法 变量 
模型 (hybrid method variables model) (Williams & 
McGonagle, 2016), 国内 学 者 基本 还 没有 注意 到 ， 
它们 的 “疗效 ”是 否 令 人 满意 ?能 否 开 发 出 更 加 简 
便 管用 的 新 技术 ? 

共同 方法 变异 可 以 说 是 一 个 游荡 在 社会 科学 
研究 上 空 的 幽 录 ,就 算 竭 尽 所 能 ， 也 很 难 将 其 彻 
底 驱 除 。 但 我 们 大 可 不 必 为 此 而 灰心 ， 只 需 正 视 
它 并 尽力 而 为 。 正 如 Kammeyer-Mueller 等 (2010， 
p.317) 所 言 :“ 尽 管 我 们 热切 期 盼 能 够 减 小 误差 的 
更 简便 的 方法 ， 并 对 传统 的 “ 硬 ' 科 学 中 那些 精确 
的 测量 工具 垂 省 不 已 , 但 昭示 着 我 们 的 学 科 走 问 
成 熟 的 标志 是 ,接纳 测量 中 的 缺陷 ， 并 采取 必要 
的 措施 来 克服 这 些 障碍 。” 


a 
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Is common method variance a “deadly plague”? Unsolved contention, 
fresh insights, and practical recommendations 
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Abstract: Common method variance (CMV) is a form of systematic variance attributed to similarities of 
measurement method facets between constructs. It has potential to distort observational correlations and 
thus elicits common method bias (CMB). Although it has been noted repeatedly in social science research 
for almost 60 years, its threat to research validity hasn’t been overwhelmingly acknowledged and remains to 
be scrutinized. Extant empirical evidence has demonstrated the ubiquity of CMV and identified distinct 
factors triggering CMB, including data source, time interval, and questionnaire design. As a result, 
cross-sectional self-reporting surveys are particularly subjected to extensive criticism. Nonetheless, some 
researchers contend that measurement error and uncommon method variance can offset or alleviate the 
underlying detriment so that pervasive anxiety regarding CMV is exaggerated and unjustified. The 
measure-centric approach underlines that CMV originates from the interplay between methods and 
constructs, and the two-dimensional CMV risk evaluation procedure should be conducted with simultaneous 
consideration of method and construct. From our view, it is preferable to cultivate a balanced and impartial 
attitude towards CMV, embrace its existence, discard the prejudice against self-reporting, and, above all, 
take proactive countermeasures based on the optimization of research design. 
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